Modèle de recherche d'information structurée basé sur la relaxation de requêtes

نویسنده

  • Mohamed Benaouicha
چکیده

RÉSUMÉ. Cet article présente un modèle pour la recherche d’information sur des documents XML basée sur la comparaison d’arbres, en utilisant le principe de relaxation de requêtes. Les requêtes et les documents sont représentés par des arbres étendus. Un arbre étendu est construit à partir de l’arbre original, avec la pondération des liens virtuels entre chaque nœud et ses descendants indirects, permettant à chacun d’atteindre directement ses descendants. Par conséquent, un seul niveau sépare chaque nœud avec ses descendants indirects. Cela permet de comparer aisément et avec flexibilité les contraintes structurelles de la requête de l’utilisateur et la structure du document. Ainsi, les fragments d’un document (éléments) retournés en réponse à la requête lui sont similaires en terme de contenu et de structure. Ce modèle supporte l’interrogation de corpus XML par des requêtes orientées contenu seulement (type CO) et d’autres orientées contenu et structure (type CAS). Quelques expérimentations ont été menées dans le cadre de la compagne d’évaluation INEX pour montrer l’efficacité de notre approche.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Apprentissage d'ordonnancements en recherche d'information structurée

RÉSUMÉ. Nous présentons un modèle d’apprentissage pour la Recherche d’Information Structurée qui ajuste automatiquement ses paramètres grâce à un ensemble d’exemples étiquetés composé de requêtes et de jugements de pertinence sur un ensemble de parties de documents. Notre modèle améliore la performance d’un système de base de Recherche d’Information en optimisant un critère de coût d’ordonnance...

متن کامل

Recherche d'information médicale pour le patient: Impact de ressources terminologiques

RÉSUMÉ. Le droit d’accès au dossier clinique par les patients est inscrit dans le code de Santé Publique. Cependant, ce contenu reste difficile à comprendre. Nous proposons une expérience, où les requêtes des patients sont utilisées pour retrouver les documents pertinents. Nous utilisons le moteur de recherche Indri, basé sur le modèle statistique de la langue, et des ressources sémantiques. L’...

متن کامل

Démarches sémantiques de recherche d'information sur le Web

Résumé : L’examen de différents projets de recherche visant à supporter les activités des membres d’une communauté à l’aide d’une mémoire collective met en évidence l’intérêt de capitaliser les requêtes formulées à la mémoire et plus généralement les savoir-faire experts d’une communauté en matière de recherche d’information. L’enjeu est de donner les moyens aux membres d’une communauté de réut...

متن کامل

Expérimentations sur un modèle de recherche d'information utilisant les liens hypertextes des pages Web

Résumé. La fonction de correspondance, qui permet de sélectionner et de classer les documents par rapport à une requête est un composant essentiel dans tout système de recherche d'information. Nous proposons de modéliser une fonction de correspondance prenant en compte à la fois le contenu et les liens hypertextes des pages Web. Nous avons expérimenté notre système sur la collection de test TRE...

متن کامل

Modèle unifié pour la recherche d'information sémantique

Résumé : Un modèle documentaire permet de définir les unités d’indexation (mots, termes, etc.) et de les relier aux documents dans lesquels elles apparaissent. Il permet également de définir les liens entre documents ou portions de documents (ex. citation). Les modèles documentaires sont généralement exploités en recherche d’information pour la représentation des documents et des requêtes et il...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008